单张4090跑到30fps,范浩强团队让VLA实时跑起来了
具体而言,对于常用的 Pi0 级别的模型(30 亿参数),在单张消费级显卡 RTX 4090 上最快可以跑到 30fps。这和大家对于 VLA 模型动辄要几十甚至上百毫秒的刻板印象形成鲜明对比。
具体而言,对于常用的 Pi0 级别的模型(30 亿参数),在单张消费级显卡 RTX 4090 上最快可以跑到 30fps。这和大家对于 VLA 模型动辄要几十甚至上百毫秒的刻板印象形成鲜明对比。
近日,理想汽车自动驾驶高级算法专家詹锟在ICCV发表主题演讲《世界模型:让我们从数据闭环走向训练闭环》,阐述了理想汽车以“从数据到训练”的系统化思路,提出了全球首个将世界模型与强化学习闭环落地于量产自动驾驶系统的完整架构。
最近,有关 AI 大模型进入瓶颈的讨论越来越多。强化学习之父 Rich Sutton 发表的前瞻论文《体验时代》指出,人工智能正在从依赖人类生成数据向体验式学习的范式转变。
中美两大科技巨头在这个领域的终极决赛已经异常清晰。刚刚,2025年美国《时代》杂志“最佳发明”榜单揭晓:中国宇树科技的人形机器人R1与美国Figure AI的Figure 03并肩而立,平分秋色。这场“中美双雄”的对决,标志着人形机器人竞赛进入巅峰阶段:R1以
倒退三年,那时的自动驾驶术语还很实在。2021年特斯拉AI DAY推出的BEV+Transformer,说白了就是用多个摄像头拼出360度鸟瞰图,解决了遮挡问题,让车摆脱高精地图依赖。随后国内车企迅速跟进,2022-2023年,华为ADS 2.0等纷纷实现量产
VLA模型作为具身智能领域的核心范式,是机器人感知、理解与行动的核心路径。然而,过去几年的研究实践中,VLA的开发生态却呈现出碎片化的问题:不同研究机构采用不同的深度学习框架、模型结构和训练管线,导致算法复现困难、工程协同复杂。研究者往往需要反复配置多份实验环
具身智能,正掀起继个人电脑与智能手机后的第三次智能终端革命。在这场变革的浪潮之巅,成立于2023年的智平方正以“开拓者”的姿态,迅速确立其全球领导地位。公司由创新领军人才郭彦东博士创立,汇聚了行业稀缺的、兼具AI研发与智能硬件全栈能力的“六边形团队”。智平方是
在电动化与智能化的全球赛道上,中国车企的领先身位已经十分明显。今年的慕尼黑车展上,中国在整车、电池、智能驾驶等全产业链的存在感十足。更有一种论调在传递:中国车企是否会“踏平”欧洲市场?
这个国庆长假的高速路堵得水泄不通,央视网的数据显示,平均每天有1250万辆新能源车在路上跑,比去年多了30%,比平时更是涨了70%。
10月17日,理想汽车宣布其L6车型累计交付量已突破33万辆。该车型于2024年4月18日上市,定位为家庭豪华五座SUV,提供Pro和Max两个配置版本,售价分别为24.98万元和27.98万元。 同时,理想汽车发布了《理想辅助驾驶秋季出行报告》,报告显示截至
近日,零跑汽车正式发布旗舰D平台以及旗舰车型D19,引发了不少消费者的关注。随后零跑科技创始人、董事长兼CEO朱江明,零跑科技高级副总裁曹力,零跑科技副总裁周颖共同出席媒体专访,就产品定位、D系列规划、技术安全、市场预期等核心问题作出详细回应。
10月16日,零跑旗下D系列首款车型——零跑D19进行了首发,并公布了一系列技术,以及产品信息。其中,增程版车型的电池容量就达到了80.3度,实现了500公里的纯电续航里程(工况未明)。油箱容积40升,CLTC综合续航里程超1300公里。
小鹏、理想这些头部新势力,车端辅助驾驶模型的参数都快赶上通用AI大模型了,小鹏说要上至少70亿参数的模型,理想明年自研芯片上车后,模型参数也会到70亿级。
最近,汽车圈子里关于智能驾驶的讨论,那叫一个热火朝天。特别是“AI大模型上车”这个概念,简直成了大家茶余饭后的谈资。你瞧,像小鹏、理想这些造车新势力,在智能驾驶这块儿的投入和动作,可真是不小。他们车上的辅助驾驶模型,参数量都快赶上好多大型AI模型了。但问题来了
一份来自央视网的报道显示,这个十一期间,平均每天有1250万辆新能源汽车从路上飞驰而过,这一数据比去年同期增长30%,较平日增长70%。
李想转发该视频并表达自己对于自动驾驶汽车发展的看法,他认为:最快3年,保守5年,全自动驾驶的智能汽车将会实现,这类汽车将成为物理世界最大的人工智能终端。
理想汽车 CEO 李想今日发文表达了自己对于自动驾驶汽车发展的看法,他认为:最快 3 年,保守 5 年,全自动驾驶的智能汽车将会实现,这类汽车将成为物理世界最大的人工智能终端。到 2030 年,可能会出现超越苹果 iPhone 规模的智能汽车企业。
据报告数据统计,在总行驶里程中,燃油驱动里程为4.4亿公里,较平日增长169.5%;纯电驱动里程达4.53亿公里,较平日增长13.3%。单车最长行驶里程突破8867公里,用户出行热情高涨。成都、杭州、重庆位列车主最爱前往的城市前三名。
核心逻辑:融合 “视觉感知、语言理解、动作生成” 三模态,实现 “看懂环境 + 听懂指令 + 做出动作” 的端到端 / 半端到端闭环;关键步骤:视觉编码:通过ViT/ResNet 等处理摄像头 / 雷达数据,提取环境特征(如车道线、障碍物);语言编码:用LLM
“刚提了理想,到底要不要纠结没选华为智驾?”“华为ADS 4.0和理想VLA谁更适合城市通勤?”近期,社交平台上关于两大主流智驾系统的讨论热度居高不下,不少车主分享了实测感受。从大家的反馈来看,两者并非“谁绝对更好”,而是在操作逻辑、适用场景、用户体验上各有侧